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摘要 : 
[目的 ] 基 于 过 程 性 数据 ， 将 MMixIRT 模型 进行 拓展 ， 以 分 析 学 生 在 问题 解决 过 程 中 的 不 同 
策略 。 
[方法 ] 拓 展 模 型 一 方面 将 步 又 的 累计 信息 作为 特定 步 又 的 过 程 数 据 ， 男 一 方面 定义 更 加 自由 
的 设计 和 矩 阵 决 定 个 体 层面 能 力 估计 所 用 到 的 信息 。 
i ete en a los te 
的 典型 特征 进行 分 析 ， 还 可 以 提供 个 体 水 平 的 能 力 估计 值 。 
[局 限 ] 模型 使 用 前 提 需 要 将 过 程 性 数据 编码 为 类 似 本 研究 中 的 数据 结构 ， 实 际 中 并 不 是 所 
有 任务 都 能 实现 这 样 的 编码 转换 。 
[结论 ] 拓 展 模 型 可 用 于 分 析 过 程 性 数据 的 特征 。 
关键 词 ， 计 算 机 动态 测验 ;问题 解决 过 程 策略 ， 过 程 性 数据 ; 拓展 的 多 水 平 混合 IRT 模型 
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[Objective] This research proposed an extended Multilevel Mixture IRT (MMixIRT) 


model to detect and interpret the problem-solving strategies. 
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[Methods] The extended model takes the accumulated response information as the 
specific steps at the process level and defines a more free matrix to determine 
the weight information used for ability estimation at the student level 
[Results]The extended model not only can analyze the typical characteristics of 
students’ strategy in problem-solving across different countries at the process 
level, but also provide ability estimates at the students’ level 
[Limitations] In terms of the generalizability of the extended model, if the 
process data for another task can be recoded as the data file in this study, 
similar models can be applied 
[Conclusions]The extended model can analyze response data at process and 
student levels 
Keywords: Computer-based Dynamic assessment;Problem-solving strategy; 
Process data; the extended MMixIRT model 
1 引言 

问题 解决 能 力 是 指 在 没有 清晰 解决 方法 的 情境 下 ， 通 过 一 系列 认 知 过 程 来 理 
解 和 解决 问题 的 能 力 (Mayer，1982) “”。 在 这 个 过 程 中 ,问题 解决 者 必须 充分 理 
解 问题 的 核心 ， 设 计 可 行 方 案 并 实施 ， 且 能 够 控制 进度 并 达到 目标 (Garofalo & 
Lester, 1985) ”“。 问 题解 决 能 力 对 于 学 习 和 取得 成 功 非常 重要 ， 很 多 全 球 范围 
的 大 型 教育 测评 项 目 都 将 其 作为 评价 的 重点 。 例 如 ， 国 际 学 生 测 评 项 目 
(Programme for International Student Assessment, PISA) (OECD, 2003, 
2013) ““ 等 。 近 年 来 ， 信 息 技术 的 进步 和 计算 机 测验 领域 的 研究 为 问题 解决 能 
力 提 供 了 全 新 的 测评 方式 。 如 2012 年 PISA 采用 计算 机 动态 测验 的 方式 , 通过 模 
拟 真实 生活 情境 中 的 问题 来 考察 学 生 的 问题 解决 能 力 , 关注 在 没有 明确 解决 方案 
的 情况 下 学 生 运 用 一 般 认 知 过 程 的 特征 COECD, 2013) “， 强 调 问题 解决 过 程 的 
动态 变化 和 互动 特征 (Funke, 2001) “。 

计算 机 的 测验 不 仅 可 改变 测验 设计 、 施 测 方式 ， 甚 至 可 以 改变 数据 分 析 的 方 
法 (DiCerbo & Behrens, 2012) “。 不 仅 可 以 考察 学 生 是 否 正确 作答 ， 而 且 可 以 
通过 系统 自动 记录 基于 时 间 的 行为 序列 (Kerr, Chung, & Iseli，2011)“， 记 
录 学 生 解 决 问题 过 程 中 的 时 间 以 及 学 生 完 成 任务 的 系列 行为 ， 称 为 过 程 性 数据 
(process data) (Zoanetti，2010)“。 基 于 过 程 性 数据 不 仅 可 以 分 析 挖 气 学 生 
的 解 题 过 程 策 略 , 同时 也 可 以 作为 问题 解决 能 力 评价 的 证 据 (DiCerbo & Behrens, 
2012) ®©. 例如，Greiff，Wtiistenberg 和 Avvisati (2015) “基于 PISA2012《 室 
昌 控制 》 任 务 的 过 程 性 数据 ,发现 一 次 只 改变 一 个 操作 变量 的 策略 不 仅 能 预测 学 
生 在 该 题 上 的 表现 ， 也 能 预测 问题 解决 总 成 绩 。 近 年 来 ， 随 着 测量 理论 和 统计 技 
术 的 发 展 ， 问 题解 决 过 程 及 其 技能 和 策略 的 探讨 越 来 越 被 重视 。 其 中 一 类 是 通过 
对 该 题目 所 需 技能 (或 属性 ) 进行 标定 ， 基 于 一 定 的 测量 模型 对 解决 问题 过 程 的 
策略 特点 进行 分 析 。 最 具 代 表 性 的 方法 是 认 知 诊断 模型 的 评估 。 如 de la Torre 
和 Douglas (2004) "采用 高 阶 潜在 结构 模型 ， 对 学 生 能 力 进行 估计 ， 并 基于 学 
生 的 认 知 属性 掌握 模式 对 其 认 知 特征 进行 分 类 。 另 一 类 是 借助 统计 模型 和 数据 挖 
掘 的 思想 ， 对 过 程 数据 殖 含 的 丰富 信息 进行 分 析 。 常 用 的 方法 有 可 视 化 分 析 方 法 
(DiCerbo, Liu, Rutstein, Choi, & Behrens, 2011) 刀 、 聚 类 分 析 方 法 
(Bergner, Shu, & von Davier, 2014) "和 分 类 分 析 方 法 (Desmarais & Baker, 
2012). seit, th A497 (Shu, Bergner, Zhu, Hao, & von Davier, 2017) 
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0 结合 隐 马 尔 科 夫 模型 (Hidden Markov Model) 和 项 目 反应 模型 ， 分 析 过 程 性 
数据 中 的 序列 作答 信息 ， 从 而 估计 学 生 的 能 力 。 本 研究 探讨 的 方法 属于 第 二 类 ， 
即 基 于 过 程 数据 分 析 学 生 在 解决 问题 过 程 中 的 不 同 策略 , 同时 基于 任务 提交 状态 
的 信息 进行 能 力 估计 。 

过 程 性 数据 具有 藤 套 结构 ， 每 个 学 生 完 成 任务 过 程 产生 的 行为 序列 〈 即 ， 过 
程 水 平 的 数据 ) 嵌 套 于 学 生 个 体 。 因此， 可 以 借鉴 多 水 平 框架 下 的 模型 来 分 析 过 
程 性 数据 (Goldstein，1987)"”。 多 水 平 混合 项 目 反 应 理论 模型 (Multilevel 
Mixture Item Response Theory，MMixIRT) 将 多 水 平 模 型 和 混合 项 目 反 应 理论 
模型 相 结合 ,不 仅 可 以 提高 模型 参数 估计 的 精确 性 ， 同 时 可 以 获得 不 同 潜在 类 别 
群体 的 测量 特征 (Cho & Cohen, 2010) "“”。 对 于 两 水 平 的 数据 ，MMixIRT 可 以 在 
第 一 水 平和 第 二 水 平 进 行 非 连续 潜在 变量 〈 洪 在 类 别 ) 和 连续 潜在 变量 〈 能 力 ) 
的 分 析 ， 第 一 水 平 的 潜 类 别 分 析 主 要 基于 被 试 作答 反应 之 间 的 关系 , 第 二 水 平 的 
潜 类 别 分 析 主 要 基于 组 内 被 试 作答 反应 之 间 的 关系 (Vermunt，2003) “"。 昌 然 
MMixIRT 为 分 析 骨 套 数据 和 类 别 特征 提供 了 思路 ， 但 是 如 果 直 接 处 理 过 程 数 据 ， 
可 能 会 带 来 两 个 问题 : (1) 过 程 中 的 一 个 步骤 仅 反 映 了 被 试 在 这 一 时 间 点 的 一 次 
操作 或 行为 表现 , 不 满足 模型 关于 不 同时 间 点 的 测量 都 是 某 一 特质 在 这 一 时 刻 表 
现 的 假设 。(2) 采用 问题 解决 的 所 有 过 程 数 据 估 计 被 试 个 体能 力 ， 会 带 来 问题 解 
决 不 同 阶段 或 不 同步 又 所 测量 特质 的 不 统一 而 导致 的 估计 值 的 偏差 和 解释 上 的 
困难 。 因 此 , 传统 的 MMixIRT 模型 在 模型 假设 和 潜 变 量 意义 的 解释 上 并 不 适用 于 
过 程 性 数据 , 如 何 借助 该 模型 的 思想 使 其 适用 于 处 理 过 程 数据 是 拓展 模型 拟 解决 
的 问题 。 

国际 上 已 经 有 越 来 越 多 的 研究 关注 过 程 性 数据 的 挖掘 ， 分 析 不 同 群 体 学 生 解 
决 问题 的 典型 特征 (Qiao & Jiao, 2018; Liao, He, & Jiao, 2019) "®"”, {8 
是 大 多 数 研 究 只 采用 了 学 生 作答 的 部 分 信息 , 或 者 只 关注 类 别 而 忽略 了 能 力 估 计 。 
很 少 有 研究 基于 过 程 数据 的 代 套 特点 ， 同 时 关注 问题 解决 策略 类 别 ， 以 及 个 体 层 
面 信息 所 反映 的 问题 解决 能 力 水 平 。 本 研究 以 PISA2012 中 一 道 问 题解 决 题目 为 
例 ， 基 于 五 个 国家 (或 地 区 ， 以 下 简称 地 区 〉 学生 问 题解 决 的 过 程 性 数据 ， 将 
MMixIRT 模型 进行 拓展 ， 并 使 用 拓展 后 的 MMixIRT 模型 分 析 学 生 在 问题 解决 过 程 
中 的 不 同 策略 ， 以 及 估计 个 体 水 平 能 力 ， 同 时 也 对 各 地 区 使 用 策略 的 特点 进行 总 
结 和 比较 。 


2 拓展 的 MMixIRT 模型 


传统 MMixIRT 模型 的 定义 和 详细 介绍 参见 (Cho & Cohen, 2010) “的 研究 。 
本 研究 对 传统 的 MMixIRT 模型 做 了 两 方面 的 修改 和 拓展 。 

首先 ， 为 体现 问题 解决 任务 过 程 中 行为 序列 连续 性 的 特点 ， 将 步骤 的 累计 信 
息 作 为 特定 步骤 的 过 程 数 据 。 可 以 表示 为 : 


Yixi = a Wt Ytri (1) 


oP yg A AR CINTA RACE 7 得 分 点 (类 似 于 后 面 交 通 题 目 中 的 路 径 》 
上 的 操作 行为 。 传 统 的 MMixIRT 模型 是 直接 对 yexi 建 模 ， 而 拓展 的 MMixIRT 模型 


是 对 累计 反应 Yixi; 进 行 建 模 。 如 果 时 间 t=, we = 1， 否 则 we = 0， 则 变 为 传统 的 


MMixIRT 模型 。 结 合 测试 题目 和 过 程 数据 的 特点 ， 采 用 累积 反应 作答 作为 过 程 J 


其 次 ， 为 使 得 过 程 水 平和 个 体 水 平 变 异 的 分 解 更 加 灵活 ， 定 义 设计 和 矩阵 A 分 
解 过 程 层面 和 个 体 层 面 的 变异 , 其 中 第 j 行 4j 用 来 定义 过 程 数 据 不 同 层面 潜 变 量 
的 分 解 权 重 。 拓 展 模 型 可 以 表示 为 : 


po 
= JRL 
maaf r 
ki 
在 传统 的 MMixIRT HALA, Yii = A +r, 即将 Yuxi 的 变异 分 解 为 第 一 水 平 


CLAY?) RUSS KE CAL?) 两 部 分 。 如 果 对 任意 的 GHEREA = 


(1,1)， 则 是 传统 的 MMixIRT 模型 。 

传统 模型 是 拓展 模型 的 特例 ,拓展 模 型 和 传统 模型 的 区 别 主要 表现 在 以 下 两 
个 方面 : (1) 过 程 水 平 每 一 步骤 的 潜在 类 别 是 前 面 各 个 步骤 的 累积 状态 ， 而 不 是 
这 一 个 步骤 的 表现 ， 描 述 累 积 状态 不 仅 可 以 更 好 地 解释 解 题 过程 策 略 的 使 用 ， 而 
且 可 以 为 探索 策略 使 用 的 连续 性 和 转换 提供 依据 ;(2) 个 体 水 平 潜 变 量 的 定义 所 
采用 的 测量 指标 与 传统 的 MMixIRT 模型 不 同 。 传统 模型 中 , 个 体 水 平 的 潜 变 量 是 
由 第 一 水 平 的 观测 变量 [yyw ©. o 3 Jii eea, Yal HVE A El (Lee, Cho, 
& Sterba, 2017) ”， 而 拓展 模型 中 可 以 定义 更 加 自由 的 设计 矩阵 4 决定 个 体 层 
面 能 力 估 计 所 用 到 的 信息 。 


3 本 研究 使 用 的 拓展 MMixIRT 模型 


拓展 的 MMixIRT 模型 比较 灵活 ， 可 以 在 第 一 水 平和 第 二 水 平 模型 中 结合 实际 
研究 关注 的 重点 定义 不 同 的 模型 。 结合 过 程 数 据 的 特点 ， 本 研究 主要 关注 学 生 在 
问题 解决 过 程 解 题 策略 的 差异 和 最 终 状 态 体现 出 个 体能 力 的 差异 ,因此 ,本 研究 
使 用 的 模型 也 是 上 述 拓展 模型 的 特例 。 
3. 1 模型 定义 

本 研究 使 用 的 拓展 MMixIRT 模型 包含 两 个 水 平 : 过 程 水 平和 个 体 水 平 。 在 过 
程 水 平 ， 定义 潜 类 别 来 描述 不 同步 又 的 异 质 性 ， 从 而 对 不 同 策 略 进 行 分 类 ; 在 个 
体 水 平 ， 定 义 连续 潜 变 量 来 估计 个 体 的 能 

过 程 水 平 模型 ; 


P(Y = Sas m+ Yer = Si) = Der P (Gr = 9,)PYr = Sar Yur = SiGe = 9) G) 


P(Y = 91，.… Yer = Sp) RRE k NFE (KHL... KES ISR GFL, ods 
ERZE k 的 步骤 总 数 ) 后 ， 得 分 点 上 的 作答 状态 为 (5,,.…,57) 的 概率 (需要 
注意 的 是 , 每 个 学 生 完 成 任务 所 使 用 的 步 又 数 及 是 不 同 的 ); 其 中 P(Cj = 9) 表 示 
第 个 学 生 的 第 j 个 步骤 属于 潜在 类 别 g 的 概率 (e=1,2,.….,G), G 为 潜在 类 别 数 。 
Cix = 9) 表 示 第 个 学 生 的 第 j 个 步 又 属于 潜在 类 别 g 的 


条 件 下 ， 前 面 j 个 步骤 的 累积 作 管状 态 为 57,.…,S7) 的 条 件 概 率 。 
个 体 水 平 模型 : 


P(Yjuet = Si, Yr = Sy 


_ 119) = SPO) 
PO Ri = 1|6,) = 1+exp(aigkr 一 Di) 


个 体 水 平 模型 表示 基于 学 生 最 终 作 答 状 态 对 个 体 水 平 的 能 力 进行 估计 , 对 应 
的 设计 矩阵 4 为 : 如 果 jj 为 被 试 最 后 一 次 提交 状态 的 作答 ， 则 4; = (1,1). T 


A; = (1,0). 在 个 体 水 平 模型 中 , yk; 表示 第 个 学 生 在 第 i 得 分 点 上 的 作答 。ai 表 
示 第 i 得 分 点 的 区 分 度 参数 ， PB, 表示 第 i 得 分 点 的 难度 参数 (i=1,2，...，D，Q 表 
示 基 于 过 程 中 最 后 一 个 步骤 估计 得 到 的 学 生 磊 的 能 力 估 计 值 。 假 设 0， 服 从 标准 
正 态 分 布 (0.~N(O D)- 


图 1 本 研究 使 用 的 MMixIRT 模型 示意 图 
图 1 表示 本 研究 使 用 的 拓展 MMixIRT 模型 的 基本 结构 。 图 中 的 方 框 表示 学 生 


在 过 程 中 的 作答 反应 ， 圆 形 表示 潜 变 量 , 三 角形 中 的 1 表示 元 素 均 为 1 的 常数 向 
量 ( 这 一 常数 向 量 的 系数 对 应 截 距 参数 B;:， 即 传统 IRT 模型 中 的 难度 参数 )。 其 
中 ， 对 于 过 程 水 平 ，Cjx 是 分 类 潜 变 量 ,对 于 个 体 水 平 ，G4 是 连续 潜 变 量 。 在 过 程 
水 平 ， 学 生 在 第 7 个 步骤 上 对 所 有 路 径 的 作答 [mm . . .， yw . ..，, 
J 可 以 由 分 类 潜 变 量 Ci 解 释 ; 在 个 体 水 平 ， 学 生 对 所 有 路 径 的 最 终 作 答 
[Fw，. ss > Yeo » . ，， 苛 可 以 由 连续 潜 变 量 90, 解释。 根据 方程 (4)， 在 
个 体 水 平 中 , 从 连续 潜 变 量 91. 指 向 每 条 路 径 反 应 状态 的 箭头 描述 了 能 力 04 的 变化 
对 选择 这 条 路 径 概率 的 影响 ， 对 应 于 区 分 度 参数 ( a ;)， 而 从 三 角形 指向 每 条 路 
径 的 箭头 表示 4 为 0 时， 这 条 路 径 的 选择 概率 ， 对 应 于 传统 IRT 模型 的 难度 参数 
(8,)。 

3.2 参数 估计 的 返 真 性 与 分 类 准确 性 
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采用 Monte Carlo 模拟 研究 对 本 研究 所 采用 的 模型 参数 估计 的 返 真 性 和 分 
类 准确 性 进行 了 检验 。 设计 考虑 2 个 影响 因素 : (1) 过 程 水 平 的 潜 类 别 数 (3 个 ， 
5 个 ); (2) 个 体 完 成 任务 的 过 程 步骤 数 (30 步 , 50 步 ), 共 2X2=4 种 实验 条 件 。 
使 用 R 语言 自 编程 序 ， 基 于 拓展 MMixIRT 模型 产生 每 种 条 件 下 的 反应 数据 。 其 
中 gj~U(1,2.5), Bi:~N(0,1), Ok~N(0,1) (Wang, Xu, Shang, & Kuncel, 2018) 
PAR a2 5 A ER BHA Nylund, Asparouhov 和 Muthén (2007) “AHR, 
不 同 条 件 下 各 类 别 所 占 比 例 和 题目 〈 路 径 ) 答对 概率 真 值 见 附录 1。 每 种 条 件 下 
假设 所 有 个 体 的 过 程 步骤 数 相 等 ， 其 中 最 后 一 个 步 又 就 是 个 体 的 最 终 作 答 状 态 ， 
用 于 估计 个 体 水 平 的 能 力 。 每 种 条 件 下 被 试 数 固 定 为 600 人 人， 数据 重复 模拟 100 
次 。 使 用 Mplus7. 11 软件 (Muthén & Muthén, 2005) 加 估计 模型 的 参数 。 

结果 表明 ， 各 参数 返 真性 较 好 ， 表 现在 各 参数 偏差 都 很 小 ， 区 分 度 参 数 均 方 
误差 (RMSE) 在 0. 2 左右 ,难度 参数 RMSE 在 0. 1 以 下 ， 能 力 参 数 RMSE 在 0. 3 左 
右 。 各 条 件 下 模型 分 类 结果 的 准确 性 较 高 ， 均 在 96% 以 上 。 
4 数据 分 析 
4.1 题 目 

本 研究 使 用 的 是 PISA2012 问题 解决 测验 中 一 道 交 通 问 题 的 题目 (Traffic 
CP007Q02) : 地 图 上 标明 了 每 条 路 径 所 需 的 时 间 ， 要 求学 生 找到 从 Diamond 到 
Einstein 的 最 快 路 径 。 正 确 的 最 短路 径 需 用 时 31min, 题目 描述 和 路 径 标 识 如 图 
2 所 示 。 

TRAFFIC 


Here is a map of a system of roads that links the suburbs within a city. The map shows the travel time in minutes at 7:00 am on each section 
of road. You can add a road to your route by clicking on it. Clicking on a road highlights the road and adds the time to the Total Time box. 


You can remove a road from your route by clicking on it again. You can use the RESET button to remove all roads from your route. 


P2 


Diamond 9 


Pl 


Total Time: [ 31 | minutes RESET 


Question : TRAFFIC 
Maria wants to travel from Diamond to Einstein. The quickest route takes 31 minutes. Highlight this route. 


YE: 地 图 上 两 个 节点 之 间 的 路 线 为 一 条 路 径 ， 标 蓝 的 路 径 为 正确 路 径 。 
图 2 PISA2012 交通 问题 题目 及 其 正确 路 径 


4. 2 过 程 性 数据 编码 

上 述 过 程 性 数据 来 源 于 data source: http://www. oecd. org/pisa/data/。 
首先 ， 算 选 与 有 效 路 径 点 击 有 关 的 信息 。 然 后 ， 将 “路 径 选 择 的 情况 ”按照 不 同 
路 径 进 行 拆 分 ， 获 得 23 条 路 径 (P1，P2，P3…，P23) 的 点 击 结果 。 表 1 是 整理 
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后 的 数据 格式 示例 ,每 一 行 代表 一 个 学 生 作答 过 程 中 的 一 个 步骤 , 每 一 列 代表 一 
条 路 径 。 其 中 ，0 表示 未 选择 ，1 表示 选择 。 例 如 ， 第 一 行 表示 编号 为 00017 的 
FEER 1 步 选择 P2， 第 二 行 表示 第 2 步 选择 P1， 第 三 行 表示 第 3 步 选 择 


P13, eee ， 第 八 行 表示 第 8 步 取消 Pl…… 
#1 整理 后 的 过 程 性 数据 举例 
序号 ”学生 编号 路 径 选 择 Pl  P2 ... Pl3 ... PIS ... P23 
1 00017 01000000000000000000000 0 1 0 0 0 
2 00017 11000000000000000000000 1 1 0 0 0 
3 00017 11000000000010000000000 1 1 1 0 0 
4 00017 ”11000000000010000100000 1 1 1 1 0 
5 00017 11000000010010000100000 1 1 1 1 0 
6 00017 11000000010010000101000 1 1 1 1 0 
7 00017 11000000010000000101000 1 1 0 1 0 
8 00017 01000000010000000101000 0 1 0 1 0 
之 后 按照 答案 重新 计 分 。 与 传统 试卷 分 析 中 的 题目 类 似 , 表 1 中 的 P1，P2， 
P3 等 23 个 变量 代表 23 条 路 径 。 正 确 路 径 为 : Diamond - Nowhere - Sakharov - 
Market - Lee - Mandela -Einstein， 即 P1，P5，P7，P8，P13 和 P17。 对 于 过 程 
中 的 每 一 步 作 答 ， 如 果 学 生 选 择 正 确 路 径 ， 则 该 路 径 计 分 为 1， 否则 计 分 为 0， 
同 理 ， 如 果 选 择 了 错误 路 径 ， 则 该 路 径 计 分 为 0， 否则 计 分 为 1。 编码 后 的 23 个 
变量 命名 为 “CP1，CP2，CP3，…，CP23”。 表 2 呈现 了 编码 后 的 数据 格式 示例 。 
例如 ， 第 一 行 表示 编号 为 00017 的 学 生 在 第 一 步 选 择 P2，P2 为 错误 路 径 ， 第 二 
行 表示 第 2 步 选 择 P1，P1 为 正确 路 径 等 。 
表 2 编码 后 的 过 程 性 数据 举例 
序号 ”学生 编号 路 径 选择 CP1 CP2 ... CP13 ... CPI8 ... CP23 
1 00017 01000000000000000000000 0 0 ... 0 ... 1 .1 
2 00017 11000000000000000000000 1 0 0 1 1 
3 00017 ”11000000000010000000000 1 0 1 1 1 
4 00017 ”11000000000010000100000 1 0 1 0 1 
5 00017 ”11000000010010000100000 1 0 1 0 1 
6 00017 11000000010010000101000 1 0 1 0 1 
7 00017 ”11000000010000000101000 1 0 0 0 1 
8 00017 ”01000000010000000101000 0 0 0 0 1 
4.3 样本 


本 研究 样本 来 自 PISA2012 问题 解决 测验 中 五 个 地 区 的 3196 名 15 岁 学 生 。 
其 中 加 拿 大 、 中 国 香港 、 中 国 上 海 、 新 加 坡 和 美国 的 样本 量 分 别 为 1449、433、 
411、456、406。 五 个 地 区 共有 139990 条 过 程 步骤， 学 生 的 平均 步骤 数 为 43. 80 
(SD=38. 06), 其 中 最 小 值 为 1, 最 大 值 为 335。 学 生 作 答 的 平均 反应 时 为 669. 22s 
(SD=543. 12s)， 其 中 最 小 值 为 10.7s， 最 大 值 为 2384. Ts. 
4.4 数据 分 析 方法 
采用 拓展 MMixIRT 模型 , 使 用 Mplus7. 11 软件 对 策略 类 别 和 个 体能 力 进 行 估 
计 。 采 用 关联 规则 挖掘 探讨 不 同 策略 类 别 之 间 的 关联 。 
关联 规则 挖掘 的 目的 如 下 : 若 两 个 或 多 个 变量 之 间 存 在 某 种 规律 性 ， 则 它们 
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之 间 存 在 关联 ， 关 联 规则 挖掘 就 是 寻找 同一 时 间 中 不 同 出 现 项 的 相关 性 ， 以 求 从 
大 量 的 数据 中 抽取 出 隐 舍 的 信息 。Apriori 算法 是 一 种 常用 的 挖掘 关联 规则 的 频 
繁 项 集 的 算法 ,其 基本 思想 是 从 包含 一 个 项 的 频繁 项 集 开 始 ， 递归 地 产生 具有 两 
个 项 的 频繁 项 集 ， 然 后 依次 递归 ， 直 到 产生 所 有 的 频繁 项 集 (Peter，2013) “。 
本 研究 基于 SPMF 平台 采用 Apriori 算法 进一步 分 析 学 生 问 题解 决策 略 之 间 的 关 
系 。 
4.5 变量 

使 用 学 生 问 题解 决 过程 中 与 作答 时 间 有 关 的 三 个 变量 (路径 点 击 数 、 重 设 数 
量 、 反 应 时 ) 与 模型 估计 结果 的 相关 进一步 验证 模型 估计 结果 的 效 度 。 其 中 ， 路 
径 点 击 数 表 示 学 生 点 击 路 径 的 数量 ; 重 设 数量 表示 学 生 取 消 前 面 所 有 路 径 点 击 状 
态 ， 重 新 开始 做 题 的 次 数 ; 反应 时 表示 学 生 完 成 任务 所 用 的 时 间 。 同 时 ， 研 究 还 
选取 了 耗 时 与 正确 作答 时 间 的 差异 , 表示 最 后 提交 状态 所 选 路 径 耗 时 与 正确 作答 
时 间 (3lmin) 差 值 的 绝对 值 。 


5 结果 


5. 1 模型 选择 

对 于 拓展 的 MMixIRT 模型 的 分 析 , 首先 需要 结合 模型 的 拟 合 指标 和 潜在 类 别 
的 可 解释 性 (Rosato & Baer, 2012) ”3 确定 分 类 的 个 数 。 表 3 给 出 五 个 地 区 数 
据 同 时 估计 得 到 的 类 别 数 为 1 7 的 模型 拟 合 指标 。 采 用 的 拟 合 指标 包括 
loglikelihood, AIC (Akaike, 1974) BIC (Schwarz, 1978) °", aBIC (Tofighi 
& Enders, 2008) “和 CAsparouhov & Muthén, 2014) 号 。 其 中 ， 前 4 个 指 
标 越 小 表示 模型 和 数据 拟 合 越 好 , 焙 是 用 来 测量 混合 模型 区 分 各 洪 在 类 别 的 程度 
的 指标 , 该 指标 越 接 近 1 表示 类 别 区 分 越 好 。 从 结果 可 以 看 出 , 潜 类 别 数 量 越 多， 
模型 拟 合 越 好 。 但 是 ,在 7 个 类 别 的 情况 下 ， 有 2 个 类 别 的 路 径 无 法 构成 从 起 点 
到 终点 的 完整 路 线 。 在 6 个 类 别 的 情况 下 ， 有 1 个 类 别 的 路 径 无 法 构成 完整 路 
线 。 因 此 , 结合 拟 合 指标 的 结果 和 类 别 的 可 解释 性 , 最 终 选择 5 个 潜 类 别 的 结果 。 


表 3 模型 拟 合 指标 结果 


自由 估计 


潜 类 别 数 参数 数量 Loglikelihood AIC BIC aBIC aa 
69 - 1249381. 591 "2498901. 183 2499580. 786 2499361.502 一 
93 - 1042231. 477 2084648. 954 2085564. 941 2085269. 384 0.927 
117 - 983675. 008 1967584. 017 1968736. 388 1968364. 557 0.935 
141 - 932442. 034 1865166. 068 1866554. 823 1866106. 720 0.930 
165 - 902308. 165 1804946. 330 1806571. 468 1806047.092 0.935 
189 - 873709. 569 1747797. 138 1749658. 661 1749058. 012 0.943 


340 - 856672. 635 1713771. 269 1715869. 176 1715192. 253 0.943 


5.2 策略 类 别 特征 及 其 与 个 体能 力 水 平 关系 

拓展 的 MMixIRT 模型 可 以 将 学 生 每 一 步 过 程 操 作 后 所 处 的 状态 分 为 5 类 , 各 
潜 类 别 点 击 各 路 径 的 次 数 见 附录 2。 分 析 各 类 别 选择 频率 最 高 的 路 径 以 及 路 径 之 
闻 的 关联 ， 可 以 形成 这 一 类 别 的 典型 路 径 。 各 类 别 所 选 典型 路 线 以 及 顺序 如 图 3 
所 示 ， 其 中 图 中 带 圈 的 数字 表示 路 径 的 顺序 ， 每 个 类 别 代表 一 种 解决 问题 策略 。 
因为 学 生 的 每 次 操作 行为 存在 关联 ， 所 以 每 次 操作 行为 所 属 的 类 别 也 存在 联系 。 
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如 果 相 邻 两 步 操作 所 属 类 别 不 同 , 则 学 生 使 用 的 策略 发 生变 化 , 即 存在 策略 转移 。 
学 生 最 后 使 用 的 策略 与 能 力 值 有 很 高 的 相关 ， 如 果 使 用 正确 策略 ， 则 会 正确 作答 
题目 ， 使 用 错误 策略 ， 则 会 错误 作答 题目 ， 但 是 使 用 不 同 的 错误 类 型 策略 ， 能 力 
值 不 同 。 


RESET | | Total Time: minutes RESET 


RESET 


RESET 


策略 5 
图 3 各 策略 选择 路 径 情况 


鉴于 策略 转移 的 存在 , 我 们 将 每 个 学 生 最 后 一 步 属 于 的 策略 作为 其 最 终 的 集 
HS, 分 析 不 同 策略 下 对 应 的 能 力 估 计 值 平均 值 ， 得 到 5 个 策略 对 应 的 能 力 平均 值 
分 别 为 - 0.714、 

-1.281、- 0.714、0. 399 #1-0.714. 结合 图 3 可 以 看 出 , 策略 4 与 正确 路 
径 相同 ， 用 时 为 Simin, 个体 的 能 力 值 也 最 高 ， 说 明 这 是 正确 的 策略 ， 策 略 2 所 
选 路 线 是 最 远 的 路 线 ， 与 正确 路 径 完全 没有 重合 ， 用 时 为 35 或 36min， 与 正确 
路 径 作 答 时 间 差 异 最 大 , 个体 的 能 力 值 最 低 ， 说 明 这 是 最 差 的 策略 ; 策略 1、3、 
5 与 正确 路 径 有 部 分 重合 ， 这 些 策略 虽然 选择 了 不 同 的 路 径 ， 错 误 类 型 不 一 致 ， 
但 是 其 个 体 的 能 力 值 相等 ， 说 明 这 些 策略 在 优 劣 程度 上 差异 不 大 。 

表 4 各 地 区 学 生 解 题 最 后 一 步 所 用 策略 分 布 比 例 〈%) 
策略 加 拿 大 中 国 香港 中 国 上 海 新 加 坡 美国 
总 体 ”错误 组 ”总体 错误 组 ”总体 错误 组 ”总体 错误 组 ”总体 错误 组 
策略 1 5.9 25.6 6.9 32.3 49 21.5 35 19.0 7.9 32.3 
策略 2 3.0 128 3.2 15.1 22 97 2.2 11.9 3.7 15.2 
策略 3 7.6 32.8 6.9 32.3 8.3 366 61 33.3 62 25.3 
策略 4 77.1 0.9 78.5 0.0 77.6 1.1 8.6 0.0 75.6 0.0 
策略 5 6.4 27.9 44 20.4 7.1 31.2 66 35.7 67 27.3 
注 : 正确 组 学 生 最 后 一 步 使 用 的 策略 均 为 策略 4， 因 此 表 中 不 再 详细 呈现 。 

表 4 呈现 了 各 地 区 学 生 在 这 道 题目 上 最 后 一 步 所 用 策略 的 分 布 情况 。 可 以 看 
出 ， 最 后 一 步 为 策略 4〈 正 确 路 径 ) 的 学 生 比 例 最 高 ， 为 策略 2〈 能 力 最 低 ) 的 
学 生 比 例 最 低 。 从 不 同 地 区 来 看 ， 新 加 坡 学 生 在 最 后 一 步 上 使 用 策略 4 的 学 生 比 
例 为 81. 6%， 略 高 于 其 他 地 区 ， 说 明 新 加 坡 学 生 在 这 道 题 上 表现 最 好 ， 而 美国 学 
生 在 最 后 一 步 上 使 用 策略 4 的 学 生 比 例 为 75. 6%， 略 低 于 其 他 地 区 ， 而 最 后 一 步 
采用 策略 2 的 比例 都 高 于 其 他 地 区 ， 说 明美 国学 生 表 现 相 对 较 差 ， 这 与 个 体能 
水 平 估计 的 均值 结果 是 一 致 的 。 另 外 , 不 同 地 区 错误 组 学 生 在 最 后 一 步 使 用 的 策 
略 上 呈现 出 不 同 的 特点 。 例 如 ， 加 拿 大 学 生 较 多 使 用 策略 3， 新 加 坡 和 中 国 上 海 
学 生 较 多 使 用 策略 5 和 3， 而 美国 学 生 较 多 使 用 策略 1， 中 国 香港 学 生 较 多 使 用 
策略 1 和 3。 

5.3 策略 应 用 情况 

为 了 探讨 过 程 数 据 中 策略 的 变换 ,研究 将 学 生 在 过 程 中 连续 使 用 某 种 策略 3 
次 或 以 上 定义 为 明显 使 用 了 该 种 典型 策略 。 在 描述 策略 转换 中 只 记录 了 不 同 策略 
之 间 的 转换 ， 如 果 转 换 过 程 中 同样 的 策略 出 现 了 多 次 ， 只 记录 最 后 一 次 转换 。 表 
现 了 各 地 区 正确 组 和 错误 组 学 生 在 解 题 过 程 中 应 用 策略 数 的 情况 .总 体 来 看 ， 
正确 组 学 生 在 解 题 过 程 中 应 用 策略 数 为 4 和 5 的 情况 最 多 。 正 确 组 学 生 中 应 用 5 
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Ao 说明 在 正确 组 中 ， 有 接近 三 分 之 一 的 学 生 是 
外 路 线 ,而 错误 组 有 超过 三 分 之 一 的 学 生 尝 试 了 


4 种 策略 即 停止 作 答 ， 提 交 了 错误 的 路 线 。 从 各 地 区 比较 来 看 ， 新 加 坡 和 美国 正 


确 组 应 用 5 种 策略 的 学 生 比 例 低 于 其 他 地 区 ， 其 中 美国 最 低 。 


表 5 各 地 区 问题 解决 过 程 应 用 策略 数 分 布 比例 (%) 


y MEK 中 国 香港 
y 正确 正确 “错误 

Age he ¥ H Hoa y 

策略 数 组 错误 组 组 组 
0 / 7.6 / 6.5 
1 7.2 19.5 9.1 17.2 
2 17.4 14.0 18.2 15.1 
3 19.8 17.7 19.1 16.1 
4 23.2 36.6 22.4 37.6 
5 32.4 4.7 31.2 7.5 


中 国 上 海 新 加 坡 美国 


正确 ”错误 ”正确 错误 正确 错误 
组 组 组 组 组 组 


/ 5.4 / 7.1 / 4.0 
8.8 25.8 8.3 22.6 10.1 21.2 
15.1 15.1 21.0 9.5 18.6 19.2 
17.9 10.8 19.6 20.2 20.5 18.2 
26.4 33.3 23.9 35.7 27.0 35.4 
31.8 9.7 27.2 4.8 23.8 2.0 


为 了 进一步 分 析 策 略 之 间 的 关系 , 表 6 和 表 7 呈现 了 Apriori 算法 的 关联 分 
析 结 果 。 频 繁 项 集 指 频 繁 同时 出 现 的 两 种 策略 ,频次 表示 这 两 种 策略 同时 出 现 的 


次 数 。 置 信和 度 是 指 包含 前 项 和 后 项 的 事务 个 数 在 包含 前 项 的 事务 总 数 中 的 比例 。 
例如 ，5==>1 表示 同时 使 用 策略 1 和 策略 5 的 学 生 人 数 占 使 用 集 略 5 学 生 人 数 的 


比例 。 根 据 表 9 结果 可 以 看 出 ， 在 正三 
策略 3 和 4， 策 略 2 和 和 5， 策略 1 和 5 
略 5 的 学 生来 说 ， 同 时 使 用 策略 3 AA 


角 组 学 生 的 策略 使 用 规则 中 ， 策 略 3 和 5， 


有 具有 较 强 的 关联 关系 。 例 如 ， 对 于 使 用 策 
既 率 为 0. 51。 与 正确 组 学 生 不 同 的 是 ， 错 


误 组 学 生 的 策略 使 用 规则 中 ,策略 3 和 4 存在 较 弱 的 关联 ,， 即 错误 组 学 生 能 够 将 
策略 3 转换 到 使 用 正确 策略 4 的 概率 较 低 。 另 外 ， 对 于 使 用 策略 5 的 学 生来 说 ， 


使 用 策略 3 的 概率 明显 低 于 正确 组 学 生 。 根据 表 7 可 以 看 出 , 各 地 区 正确 组 和 错 
误 组 学 生 使 用 策略 规则 基本 一 致 , 但 是 中 国 上 海 的 正确 组 学 生 表现 出 不 一 致 的 策 
略 使 用 规则 ， 有 具体 来 讲 ， 使 用 策略 2 的 学 生 使 用 策略 5 的 概率 、 使 用 策略 3 的 学 
生 使 用 策略 5 的 概率 明显 高 于 其 他 地 区 ; 使 用 策略 4 的 学 生 使 用 策略 3 的 概率 、 
使 用 策略 3 的 学 生 使 用 策略 4 的 概率 明显 低 于 其 他 地 区 。 

表 6 学 生 总 体 应 用 策略 之 间 的 关系 


正确 组 普 误 组 

BAE 频次 置信 和 度 
0.23 110 0.26 
0.24 110 0.27 
0.29 131 0.30 
0.37 131 0.34 
0.27 / / 

0.36 / / 

0.51 161 0.37 
0.37 161 0.33 


RT 各 地 区 学 生 应 用 策略 之 间 的 关系 


序号 频繁 项 集 

1 5==>1 301 

2 1==>5 301 

3 5==>2 386 

4 2==>5 386 

5 4==>3 661 

6 3==>4 661 

7 5==>3 683 

8 3==>5 683 
序 “频繁 项 正确 组 置信 度 
号 集 


彰 误 组 置信 和 度 


me +R ”中国 新 加 美 Me FR PEH 新 加 美 


lu 


le MN FW NY 一 


香港 
0.20 
0.21 
0.28 
0.35 
0.25 
0.34 
0.50 
0.37 


上 海 
0.18 
0.22 
0.27 
0.42 
0.18 
0.25 
0.53 
0.46 


5.4 过 程 性 变量 和 能 力 的 关系 
表 8 过 程 变 量 的 描述 统计 及 其 与 个 体 水 平 能 力 估 计 值 的 相关 
作答 结果 过 程 变量 WEK i 国 香港 中 国 上 海 新 加 坡 美国 
相关 均值 相关 均值 相关 均值 ”相关 均值 相关 均值 
路 径 点 击 数 / 93.56 / 92.71 / 87.24 / 88.84 / 79.76 
ee 重 设 数量 / 1.12 / 0.97 / 1.03 / 0.83 / 0.92 
IEA 
反应 时 / 679.57 / 628.69 / 660.47 / 740.34 / 675.54 
个 体能 / 0.40 / 0.40 0.40 / 0.40 / 0.40 
路 径 点 击 数 -0.01 99.64 0.18 123.83 -0.04 109.46 0.04 121.73 0.00 93.03 
重 设 数量 0.07 1.55 0.11 1.55 -0.10 1.37 0.14 1.68 0.14 1.39 
间 误 。 ” 耗 时 与 正确 作答 时 间 的 差异 -0.02 5.91 0.08 4.19 0.10 3.12 0.16 4.42 -0.04 23.74 
反应 时 0.06 647.12 0.12 552.35 0.06 606.24 -0.01 683.37 0.04 663.62 
个 体能 / -0.79 / -0.79 / -0.76 / -0.79 / -0.79 
路 径 点 击 数 -0.03 94.96 -0.13** 9940 -0.12* 92.27 -0.13** 94.90 -0.08 — 83.00 
重 设 数量 -0.09** 122 -0.11* 1.09 -0.09 1.10 -0.17** 0.98 -0.10 1.03 
总 体 ” 耗 时 与 正确 作 时 间 的 差异 -0.39*** 1.39 -0.34*** 0.90 -0.32*** 0.71 -0.35** 0.81 -0.39*** 24.32 
反应 时 0.03 672.08 0.07 612.29 0.05 648.20 0.04 729.84 0.01 672.64 
个 体能 / 0.13 / 0.15 / 0.14 / 0.18 / 0.11 


È: *p < 0.05, **p < 0.01, ***p < 0.001, 
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表 8 呈现 了 路 径 点 击 数 、 重 设 数量 、 耗 时 与 正确 作答 时 间 的 差异 、 反 应 时 这 
些 过 程 性 变量 以 及 个 体能 力 值 的 描述 性 统计 指标 , 及 过 程 性 变量 与 个 体能 力 值 的 
相关 。 从 表 8 中 可 以 看 出 ， 对 于 所 有 地 区 ， 正 确 组 的 路 径 点 击 数 小 于 错误 组 ， 正 
确 组 的 重 设 数量 小 于 错误 组 ,正确 组 和 错误 组 的 反应 时 没有 显著 差异 。 耗 时 与 正 
确 作 答 时 间 的 差异 越 大 , 个 体能 力 估 计 值 的 平均 水 平 越 低 。 另 外 ， 结 果 还 反映 了 
不 同 地 区 在 完成 题目 过 程 中 的 特点 。 从 描述 统计 方面 来 看 ,各 地 区 呈现 出 了 不 同 
的 典型 特征 , 例如 , 美国 学 生 个 体能 力 估计 值 的 平均 水 平 最 低 , 路 径 点 击 数 最 少 ， 
错误 组 耗 时 与 正确 作答 时 间 的 差异 明显 大 于 其 他 地 区 ; 而 新 加 坡 学 生 个 体能 力 佑 
计 值 的 平均 水 平 最 高 ， 但 是 平均 反应 时 也 最 长 。 


6 讨论 与 结论 


拓展 的 MMixIRT 模型 结合 了 IRT 模型 、 潜 类 别 模型 和 多 水 平 模型 的 特点 , 不 
仅 可 以 在 过 程 水 平分 析 策 略 类 别 特征 , 而 且 还 可 以 在 个 体 水 平 估计 能 力 值 。 在 过 
程 水 平 ， 使 用 潜 类 别 模型 确定 学 生 解 题 的 过 程 策略 ， 深 入 探讨 策略 应 用 的 情况 ; 
在 个 体 水 平 , 使 用 IRT 模型 估计 学 生 的 个 体能 力 值 。 模 型 优势 在 于 能 够 同时 描述 
过 程 水 平和 个 体 水 平 的 信息 ,过 程 水 平 中 的 策略 分 析 能 够 得 到 不 同 群体 在 问题 解 
决 过 程 中 的 典型 行为 模式 和 思维 特点 , 从 而 更 好 地 为 提高 学 生 的 问题 解决 能 力 提 
供 有 针对 性 的 信息 。 另 外 , 拓展 MMixIRT 模型 具有 良好 的 参数 返 真性 和 较 高 的 分 
类 准确 性 ， 能 够 应 用 于 过 程 性 数据 的 分 析 。 

研究 将 拓展 的 MMixIRT 模型 应 用 于 分 析 5 个 地 区 学 生 完成 问题 解决 题目 的 
过 程 性 数据 ， 验 证 了 该 模型 结果 的 合理 性 和 可 解释 性 。 首 先 ， 操 作 步 又 特征 可 分 
为 5 种 策略 ,体现 了 问题 解决 过 程 中 不 同 能 力 水 平 学 生 的 特征 。 策略 4 是 正确 的 
解 题 策略 ， 最 后 一 步 为 策略 4 的 学 生 比例 越 高 ， 平 均 能 力 水 平 也 越 高 。 策 略 2 是 
距离 正确 路 径 最 远 ， 耗 时 最 长 的 策略 ， 即 最 差 的 策略 。 最 后 一 步 为 策略 2 的 学 生 
比例 越 多 ， 平 均 能 力 水 平 也 越 低 。 其 次 ， 关 于 策略 应 用 和 转换 的 结果 体现 了 学 生 
解决 问题 过 程 中 试 误 策略 的 应 用 ， 这 与 现实 中 问题 解决 策略 的 使 用 一 致 。 在 正确 
组 中 ， 学 生 在 解 题 过 程 中 应 用 策略 数 为 4 次 、5 次 的 情况 最 多 ， 说 明 学 生 通 过 不 
断 转 换 策 略 完 成 题目 ， 很 少 有 学 生 只 使 用 一 种 正确 策略 直接 解决 了 问题 。 另 外 ， 
最 典型 的 正确 组 学 生 策 略 使 用 规则 是 从 策略 3 转换 到 策略 4。 也 融 是 学 生 先 选择 
了 与 正确 路 线 重合 的 前 三 条 路 径 ， 然 后 在 下 一 条 路 径 上 ， 没 有 选择 从 Market 到 
Lee， 而 是 从 Market 到 了 Park CUE] 3， 后 面 三 条 路 径 的 用 时 加 起 来 为 16min， 
大 于 正确 答案 后 三 条 路 径 的 用 时 15min。 然 后 学 生 可 能 发 现存 在 比 这 样 走 用 时 更 
短 的 路 线 ， 于 是 从 策略 3 转换 到 了 策略 4， 即 从 Market 改 为 走向 Lee， 从 而 选择 
了 正确 答案 的 路 线 。 而 在 错误 组 中 ,学生 在 解 题 过 程 中 应 用 策略 数 为 4 的 情况 最 
Z, 但 是 较 少 的 学 生 坚 持 尝 试 了 5 种 策略 。 最 后 ， 操 作 过 程 变 量 与 策略 和 能 力 之 
间 关 联 分 析 的 结果 , 证 实 了 这 一 模型 分 析 过 程 数据 的 有 效 性 。 部 分 过 程 性 的 变量 
与 个 体 的 问题 解决 能 力 有 显著 相关 ， 结 果 表 明 ， 除 过 程 中 学 生 策略 选择 外 ， 其 他 
过 程 变量 (例如 ， 路 径 点 击 数 、 重 设 次 数 等 ) 也 均 在 不 同 程度 上 与 学 生 的 问题 解 
决 能 力 存 在 相关 。 

研究 还 关注 了 不 同 地 区 间 过 程 水 平和 个 体 水 平分 析 结 果 的 比较 。 首 先 , 各 地 
区 在 过 程 性 变量 上 呈现 出 不 同 的 特点 ， 例 如 ， 美 国学 生 问题 解决 能 力 最 低 ， 路 径 
点 击 数 最 少 ,错误 组 耗 时 与 正确 作答 时 间 的 差异 明显 大 于 其 他 地 区 ， 而 新 加 坡 学 
生 问 题解 决 能 力 最 高 ， 反 应 时 也 最 长 。 从 文化 差异 上 来 看 ， 西 方 文化 背景 下 学 生 
关注 个 人 价值 以 及 个 体 的 好 奇 心 和 兴趣 , 而 儒家 文化 背景 下 学 生 关 注 个 体 努 力 程 
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度 ， 他 们 认为 努力 是 实现 成 功 的 必 备 因素 (Li, 2012) “"。 此 题 考查 的 是 问题 解 
决 的 计划 与 执行 部 分 ， 如 果 学 生 不 断 努 力 试 错 ， 也 可 以 得 到 正确 答案 。 努 力 程度 
(工具 性 动机 ) 会 促进 学 生 问 题解 决 的 表现 。 这 也 可 能 是 新 加 坡 、 中 国 上 海 、 中 
国 香港 学 生 的 问题 解决 能 力 较 高 的 原因 。 而 新 加 坡 学 生 问 题解 决 表 现 最 好 ， 主 要 
源 于 新 加 坡 的 整体 课程 设计 注重 学 生 的 问题 解决 能 力 , 将 问题 解决 能 力 系统 纳入 
课程 ,例如 ， 其 在 中 小 学 数学 大 纲 中 在 数学 过 程 部 分 ， 明 确 列 出 了 思维 技能 和 问 
题解 决策 略 (Fan & Zhu, 2007) 号。 因此 ， 在 策略 使 用 上 ， 新 加 坡 正确 组 应 用 
5 种 策略 的 学 生 比 例 明 显 低 于 其 他 地 区 ， 说 明 新 加 坡 学 生 解 决 问题 典型 特征 是 思 
考 时 间 比 较 长 ， 使 用 策略 数 相 对 较 少 而 得 到 正确 答案 。 而 美国 学 生 正 确 组 应 用 5 
种 策略 的 学 生 比 例 也 较 低 , 解决 问题 典型 特征 是 思考 时 间 比 较 少 , 但 是 并 未 像 其 
他 地 区 一 样 , 去 尝试 足够 多 的 策略 最 终 得 到 正确 结果 。 其 次 , 加 拿 大 、 中 国 香港 、 
中 国 上 海 、 新 加 坡 错误 组 学 生 在 最 后 一 步 较 多 使 用 策略 3。 从 策略 应 用 的 结果 可 
以 看 出 ， 很 多 作答 正确 的 学 生 都 是 从 策略 3 转 到 了 策略 4， 说 明 对 这 些 解 题 错误 
的 学 生 ， 如 果 再 给 予 更 多 的 思考 时 间 ， 有 很 大 的 可 能 最 终 转 换 为 正确 的 策略 。 这 
些 结果 可 以 为 教学 和 训练 提供 更 加 丰富 的 信息 ， 帮 助教 师 给 予 有 针对 性 的 指导 。 
综 上 , 过 程 性 数据 分 析 的 结果 一 方面 能 够 给 教育 测量 研究 者 和 测验 题目 研发 者 提 
供 更 多 信息 ， 以 便 进 行 命题 改 进 ， 另 一 方面 ， 这 些 信 息 还 可 以 被 纳入 测验 计 分 体 
系 ,测验 计 分 不 再 只 基于 学 生 个 体 的 最 后 作答 ， 而 结合 了 学 生 策略 的 使 用 ， 这 将 
在 一 定 程度 上 丰富 测验 分 数 的 含义 。 

拓展 的 MMixIRT 模型 比较 灵活 , 可 以 在 实际 中 结合 题目 的 特点 和 关注 的 重点 
定义 不 同 的 模型 。 首 先 ， 可 以 在 模型 的 个 体 水 平 中 加 入 描述 学 生 类 别 特征 的 潜 类 
别 ， 也 可 以 考虑 在 过 程 水 平 中 加 入 描述 步骤 能 力 的 连续 潜 变 量 ， 探 讨 学 生 在 解 题 
过 程 中 能 力 的 变化 情况 (Liu, Liu, & Li, 2018) “。 其 次 ， 还 可 以 在 模型 加 入 
能 够 减少 测量 误差 并 能 预测 学 生 问 题解 决 能 力 的 其 他 协 变量 , 例如 学 生 的 动机 等 
(Fox & Glas, 2003) “。 最 后 ,本 研究 为 单 任务 情境 ， 当 分 析 对 象 为 多 任务 时 ， 
可 以 将 其 拓展 为 三 水 平 模型 ,分别 为 过 程 水 平 、 任 务 水 平和 个 体 水 平 ， 同时 考察 
不 同 任务 情境 问题 解决 策略 的 应 用 以 及 多 任务 情境 下 个 体能 力 估计 。 

本 研究 具有 一 定 的 局 限 性 。 首 先 ， 在 策略 转换 分 析 时 ， 将 使 用 某 种 策略 3 次 
或 以 上 定义 为 使 用 了 该 种 典型 策略 , 这 样 的 定义 也 损失 了 一 部 分 不 稳定 的 策略 转 
换 的 信息 。 如 果 这 种 不 稳定 的 策略 转换 也 是 考察 的 对 象 ， 可 以 将 这 些 信 息 纳入 策 
略 转 换 的 分 析 中 。 其 次 ， 分 析 过 程 中 只 是 将 单一 的 路 径 作为 分 析 的 单元 ， 没 有 考 
虑 可 能 的 路 径 组 合 (如 某 些 情况 下 ， 不 同 路 径 之 间 的 链接 是 唯一 的 ， 可 能 将 这 些 
路 径 合 起 来 分 析 更 加 合理 ), 可 以 在 未 来 的 研究 中 考虑 不 同 路 径 组 合 转换 的 模型 。 
另外 ， 这 一 模型 在 复杂 问题 解决 过 程 中 的 普 适 性 尚 待 进一步 检验 ， 使 用 MMixIRT 
模型 的 前 提 是 需要 将 过 程 性 数据 编码 为 类 似 本 研究 中 的 数据 结构 , 实际 中 可 能 某 
些 任务 不 太 容易 实现 这 样 的 编码 转换 。 

研究 得 出 的 主要 结论 如 下 : 

第 一 , 拓展 的 MMixIRT 模型 不 仅 可 以 基于 行为 序列 分 析 学 生 解 题 过程 中 策略 
使 用 情况 ， 还 可 以 在 个 体 水 平 上 提供 能 力 估计 值 。 

第 二 , 使 用 拓展 的 MMixIRT 模型 可 以 对 不 同 地 区 学 生 在 解决 问题 时 策略 使 用 
情况 的 典型 特征 进行 分 析 ， 为 有 针对 性 的 训练 提供 参考 。 
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附录 1 模拟 研究 中 各 类 别 数量 比例 及 题目 答对 概率 


TERA 


BEAN 3 
类 别 2 类 别 3 
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附录 2 每 个 类 别 点 击 各 路 径 的 次 数 
路 径 类 别 1 类 别 2 类 别 3 类 别 4 类 别 5 
P1 31050 1010 26185 10450 1175 
P2 358 20917 272 71 26673 
P3 14 4771 10 4 10 
P4 16 1942 45 10 12 
P5 10752 320 396 8981 4465 
P6 33 3751 24 17 19 
P7 7554 1027 4109 6684 7135 
P8 1082 241 433 11053 4972 
P9 860 800 22245 154 14474 
P10 15100 380 728 259 394 
P11 1468 6723 7752 477 9474 
P12 27 7128 33 10 84 
P13 26422 535 27272 10874 276 
P14 70 12160 120 23 197 
P15 766 1131 5969 345 4394 
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